智能论文笔记

The MIS Check-Dam Dataset for Object Detection and Instance Segmentation Tasks

Chintan Tundia , Rajiv Kumar , Om Damani , G. Sivakumar

分类：计算机视觉

2021-11-30

在其他计算机视觉任务中，深入学习导致对象检测和实例分割的最近进步。这些进步导致广泛的基于学习方法和相关方法的广泛应用于卫星图像的对象检测任务中。在本文中，我们介绍了MIS检查水坝，从卫星图像中的卫星图像进行新数据集，用于构建用于检查和映射的自动化系统，专注于用于农业的灌溉结构的重要性。我们审查了一些最新的对象检测和实例分段方法，并在我们的新数据集中评估其性能。我们根据各种网络配置和骨干架构评估了几个基于单级，两阶段和注意的方法。数据集和预训练型号可在https://www.cse.iitb.ac.in.in/gramdridisti/上获得。

translated by 谷歌翻译

Bounding Box Priors for Cell Detection with Point Annotations

Hari Om Aggrawal , Dipam Goswami , Vinti Agarwal

分类：计算机视觉

2022-11-11

The size of an individual cell type, such as a red blood cell, does not vary much among humans. We use this knowledge as a prior for classifying and detecting cells in images with only a few ground truth bounding box annotations, while most of the cells are annotated with points. This setting leads to weakly semi-supervised learning. We propose replacing points with either stochastic (ST) boxes or bounding box predictions during the training process. The proposed "mean-IOU" ST box maximizes the overlap with all the boxes belonging to the sample space with a class-specific approximated prior probability distribution of bounding boxes. Our method trains with both box- and point-labelled images in conjunction, unlike the existing methods, which train first with box- and then point-labelled images. In the most challenging setting, when only 5% images are box-labelled, quantitative experiments on a urine dataset show that our one-stage method outperforms two-stage methods by 5.56 mAP. Furthermore, we suggest an approach that partially answers "how many box-labelled annotations are necessary?" before training a machine learning model.

translated by 谷歌翻译

Stock Market Prediction using Natural Language Processing -- A Survey

Om Mane , Saravanakumar kandasamy

分类：机器学习

2022-08-26

股票市场是一个网络，为几乎所有主要的经济交易提供平台。虽然投资股票市场是一个好主意，但对单个股票进行投资可能不是一个好主意，尤其是对于休闲投资者而言。智能储备需要深入研究和大量奉献精神。预测这种股票价值提供了巨大的套利利润机会。找到解决方案的这种吸引力促使研究人员找到了过去的问题，例如波动，季节性和时间依赖时间。本文调查了自然语言处理和机器学习技术领域的最新文献，用于预测股票市场的发展。本文的主要贡献包括许多最近的文章的复杂分类以及股票市场预测研究及其相关领域的最新研究趋势。

translated by 谷歌翻译

Measuring Forgetting of Memorized Training Examples

Matthew Jagielski , Om Thakkar , Florian Tramèr , Daphne Ippolito , Katherine Lee , Nicholas Carlini , Eric Wallace , Shuang Song , Abhradeep Thakurta , Nicolas Papernot

分类：机器学习

2022-06-30

机器学习模型表现出两个看似矛盾的现象：训练数据记忆和各种遗忘形式。在记忆中，模型过于适合特定的培训示例，并容易受到隐私攻击的影响。在忘记时，最终忘记了在培训初期出现的例子。在这项工作中，我们将这些现象联系起来。我们提出了一种技术，以衡量训练示例的细节在多大程度上``忘记''，从而不易受到他们最近未曾见过的示例的隐私攻击的影响。我们表明，尽管非凸性可以防止在最坏的情况下忘记发生，但标准图像和语音模型在经验上确实会随着时间的流逝而忘记示例。我们将非确定性识别为潜在的解释，表明经过确定性训练的模型不会忘记。我们的结果表明，当使用极大的数据集培训（例如用于预训练模型的示例）时，早期看到的例子可能会观察到隐私益处，而牺牲了后来看到的示例。

translated by 谷歌翻译

Detecting Unintended Memorization in Language-Model-Fused ASR

W. Ronny Huang , Steve Chien , Om Thakkar , Rajiv Mathews

分类：自然语言处理 | 机器学习

2022-04-20

端到端（E2E）模型通常通过浅融合伴随语言模型（LMS），以提高其整体质量以及对稀有单词的认可。同时，几项先前的作品表明，LMS容易在训练数据中无意中记住稀有或独特的序列。在这项工作中，我们设计了一个框架，用于检测LM培训数据中随机文本序列的记忆（我们称为Canaries），当一个人只有Black-Box（Query）访问LM融合语音识别器，而不是直接访问到达LM融合语音识别器LM。在与变压器LM融合的生产级构象体RNN-T E2E模型中，我们表明可以从300m示例的LM训练数据中检测到单一疾病的金丝雀的记忆。我们还激发了保护隐私的动机，我们还表明，通过示例梯度倾斜的LM培训而没有损害整体质量，这种记忆会大大减少。

translated by 谷歌翻译

Extracting Targeted Training Data from ASR Models, and How to Mitigate It

Ehsan Amid , Om Thakkar , Arun Narayanan , Rajiv Mathews , Françoise Beaufays

分类：机器学习

2022-04-18

最近的工作设计了方法来证明ASR培训中的模型更新可以泄漏计算更新中使用的话语的潜在敏感属性。在这项工作中，我们设计了第一种方法来证明有关培训ASR模型培训数据的信息泄漏。我们设计了噪声遮罩，这是一种填充风格的方法，用于从训练有素的ASR模型中提取培训数据的有针对性部分。我们通过在四个设置中使用用于训练最先进的构象模型的LibrisPeech数据集中提取名称来证明噪声掩蔽的成功。特别是，我们证明我们能够以11.8％的精度从蒙面的训练说话中提取正确的名称，而该模型的时间为55.2％的时间，则可以输出一些名称。此外，我们表明，即使在使用合成音频和部分成绩单的设置中，我们的方法也达到2.5％的正确名称准确性（47.7％的任何名称成功率）。最后，我们设计了单词辍学，这是一种数据增强方法，我们在训练中与多级训练一起使用（MTR），它提供了可比的实用程序作为基线，并通过在四个评估的设置中通过噪声掩盖进行了大大减轻提取。

translated by 谷歌翻译

Prabhupadavani: A Code-mixed Speech Translation Data for 25 Languages

Jivnesh Sandhan , Ayush Daksh , Om Adideva Paranjay , Laxmidhar Behera , Pawan Goyal

分类：自然语言处理

2022-01-27

如今，对混合代码的兴趣已在自然语言处理（NLP）中变得普遍存在；但是，对于语音翻译（ST）任务解决这一现象并没有太多关注。这完全可以归因于缺乏由代码混合的ST任务标记数据。因此，我们介绍了Prabhupadavani，这是一种用于25种语言的多语言代码混合ST数据集。它是多域的，涵盖了十个语言家庭，其中包含130多名演讲者的94小时语音，并手动与目标语言的相应文本保持一致。 Prabhupadavani是关于吠陀文化和遗产的文献，在文献中引用文学的情况下，在人文教学的背景下，代码转换很重要。据我们所知，Prabhupadvani是ST文献中第一个可用的多语言代码混合ST数据集。该数据也可用于代码混合的机器翻译任务。所有数据集可以在https://github.com/frozentoad9/cmst上访问。

translated by 谷歌翻译

Public Data-Assisted Mirror Descent for Private Model Training

Ehsan Amid , Arun Ganesh , Rajiv Mathews , Swaroop Ramaswamy , Shuang Song , Thomas Steinke , Vinith M. Suriyakumar , Om Thakkar , Abhradeep Thakurta

分类：机器学习

2021-12-01

我们重新审视使用公共数据来改善差异私有（DP）模型培训的隐私/实用权折衷的问题。在这里，公共数据是指没有隐私问题的辅助数据集。我们考虑与私人培训数据相同的分发的公共数据。对于凸损失，我们表明镜子血清的变体提供了与模型的维度（$ p $）的人口风险保证。具体地，我们将镜像血液应用于由公共数据生成的丢失作为镜像映射，并使用私有（敏感）数据生成的丢失的DP梯度。为了获得维度独立性，我们需要$ g_q ^ 2 \ leq p $公共数据样本，其中$ g_q $是损失功能各向同性的量度。我们进一步表明，我们的算法具有天然的“噪音稳定性”属性：如果围绕当前迭代公共损失，请以$ V $的方向满足$ \ alpha_v $ -strong凸性，然后使用嘈杂的渐变而不是确切的渐变偏移我们的下一次迭代$ v $ v $比例为$ 1 / alpha_v $（与DP-SGD相比，换档是各向同性的）。在前作品中的类似结果必须使用预处理器矩阵形式的公共数据明确地学习几何图形。我们的方法也适用于非凸损失，因为它不依赖于凸起假设以确保DP保证。我们通过显示线性回归，深度学习基准数据集（Wikitext-2，Cifar-10和Emnist）以及联合学习（StackOverflow）来证明我们的算法的经验效果。我们表明，我们的算法不仅显着改善了传统的DP-SGD和DP-FedAVG，它没有访问公共数据，而且还可以改善DP-SGD和DP-FedAVG对已与公众预先培训的模型数据开始。

translated by 谷歌翻译

Urine Microscopic Image Dataset

Dipam Goswami , Hari Om Aggrawal , Rajiv Gupta , Vinti Agarwal

分类：计算机视觉

2021-11-19

尿液分析是检测泌尿系统相关问题的标准诊断测试。尿液分析的自动化将降低整体诊断时间。最近的研究使用了尿道显微数据集来设计基于深度学习的算法来分类和检测尿液细胞。但这些数据集没有公开可供进一步研究。为了减轻尿Datsets的需要，我们制备尿泥沉积物微观图像（UMID）数据集，其包含约3700个细胞注释和3类细胞即RBC，PU和上皮细胞。我们讨论了准备数据集和注释所涉及的若干挑战。我们将数据集公开提供。

translated by 谷歌翻译

Robust 3D Scene Segmentation through Hierarchical and Learnable Part-Fusion

Anirud Thyagharajan , Benjamin Ummenhofer , Prashant Laddha , Om J Omer , Sreenivas Subramoney

分类：计算机视觉

2021-11-16

3D语义分割是几个场景的基本构建块，了解自主驾驶，机器人和AR / VR等应用程序。若干最先进的语义分割模型遭受零件错误分类问题，其中相同对象的部分被错误地标记。以前的方法已经利用了分层，迭代方法来熔断语义和实例信息，但它们在上下文融合中缺乏可读性，并且是计算复杂和启发式驱动的。本文提出了分段融合，一种基于新的语义和实例信息的分层融合方法，以解决零件错误分类。呈现的方法包括图形分段算法，用于将点分组到段落的段，该段汇编到分段 - 方向特征中的点亮特征，基于学习的关注的网络基于它们的语义和实例特征来融合这些段，然后是简单而有效的连接的组件标记算法将段特征转换为实例标签。段融合可以灵活地使用任何网络架构进行语义/实例分段。当在SCANNet和S3DIS数据集上评估时，它通过高达5％提高了多个语义细分骨架的定性和定量性能。

translated by 谷歌翻译